近来很多大拿做了 2018 年 NLP 的回顾,今天推荐一波 Elvis Saravia 的一篇报告,总结了上一年 NLP 学术界和工业界发生的大事,也包括 SOTA 的论文结果及有趣的研究方向,每个 NLPer 闲下来都可以读一读。
18 年 1 月在知乎上的回答 在NLP领域,现阶段最有希望突破深度学习牢笼的研究/思路有哪些? - 徐阿衡的回答 - 知乎,部分方向在这一年都有了可喜的突破。
不容辩驳,18 年最大的亮点还是在 transfer learning,从 ELMo 到 ULMFit 到 GPT 到 BERT,性能横扫各大 NLP 测试任务。然而除了 BERT,迁移学习在其他方向上也有新的进展,如
- 任务型对话中,利用迁移学习将已经学好大语种的 dialog state tracking 迁移至小语种
- 测量并利用视觉任务之间的关联性来避免重复学习,用更少的数据学习“一组”任务
- GLoMo 学习图表示,从大规模无标注数据中学习数据单元之间的依赖关系,输出隐关系图,将图迁移到下游任务提高任务性能
- …
个人比较关心的是 对话机器人(Conversational AI) 和 医疗健康(Health and Lifestyle) 方向,重点关注,和各位分享一下~
一方面,对话机器人在车载(奔驰MBUX)、电商(Facebook e-Commerce messager bot)、银行(Mastercard)、保险(AskArvi )等各领域都有广泛的应用,另一方面 情感识别 成为 对话机器人 一个重要方向, Wired.com 解释了语音情感识别如何帮助机器与人建立健康的关系,初创公司 Hugging Face 获得 400万美元融资,来打造情感智能聊天机器人。另外在情感分析领域,学术界也涌现了大量有趣的 paper
- Deep Learning for Sentiment Analysis : A Survey
- Emotional Chatting Machine
- 情感领域的 style transfer
- 利用 multimodal learning 做的 sarcasm detection
- flow of emotions over a book
- …
之前预测的很难有突破的 常识(common sense),Allen AI 斥巨资(125 million 美元)在 Alexandria 项目 上,来支持开发具有常识的 AI,可以期待一下~
当然对话机器人的发展也不是一帆风顺只有鲜花与赞好,Wired 发了一篇文章来讨论 Facebook 虚拟助理 M 的现状 ,以及公司为何计划将其关闭。
而在 医疗健康 领域,通过 NLP 技术,初创公司 Proven Beauty 向消费者提供定制化的护肤产品线;Stitch 销售具有个人风格的时尚;Jessica Kent 将 NLP 应用于电子医疗记录,精确分析数据来提高心脏衰竭病人的护理工作;Anthem 与 doc.ai 合作分析并预测过敏模式;Woebot 作为自动心理治疗机器人获得 A 轮 800 万美元融资;Linguamatics 提供新药研发的工具;机器在 CT 扫描中的疾病检测比人类肿瘤学家的诊断速度快150倍;文本挖掘技术 能根据病人的生物标记制定癌症治疗方案……可以说 2018 年 AI 在医疗健康领域焕发着勃勃生机,而在学术界的 clinical NLP 方向,也有一些不错的 paper:
- 数据整合
- 最火的 CT 扫描等医疗影像相关任务
- NLP 在 clinical informatics research 的应用和挑战
- CV、语音、NLP 相结合来预测抑郁程度
- 用多模态医疗数据训练词向量,学习医学概念
- …
除了在对话机器人和医疗健康领域,NLP 在金融、法律和广告等行业中也有崭新的表现,如 ASIC(Australian Securities and Investments Commission)希望利用 NLP 加强管理公司和金融服务法律;Tumi 使用 NLP 技术进行目标营销;华尔街的各大金融公司也在 NLP 和 ML 上下了血本,希望能实现 自动化投资管理;律所也在用 AI 技术对战……
报告自然是不止这些,还介绍了许多有趣的工作像 Code2vec、长篇音乐生成、看图写诗、通过文字描述生成人脸等等等等,阿衡都觉得颇为之有趣~~ 公众号回复 2018 NLP 就可以获取原文 PDF 啦~